#AI 模擬 | 熱門關鍵字 | 鉅亨號

最新 AI 模擬軍事博弈揭示致命真相：面對地緣危機，最先進的 AI 在 95% 的對局中按下了核按鈕。機器不懂恐懼，拒絕投降，安全協議在壓力下全面失效。而五角大樓正將其引入真實指揮室，人類的和平歲月岌岌可危。在人類掌握核武器的八十多年裡，支撐脆弱和平的基石是一種極其感性的心理狀態——對徹底毀滅的恐懼。當冷戰的危機逼近頂點時，決策者往往會在懸崖邊退縮。如今，把這種關乎人類存亡的決策權交給最先進的 AI，會發生什麼？結論令人不寒而慄。倫敦國王學院的學者肯尼斯·佩恩（Kenneth Payne）近期完成了一項針對前沿大語言模型的兵棋推演實驗。論文地址：https://arxiv.org/pdf/2602.14740v1實驗結果指向一個令人不安的趨勢：當機器代替人類站在地緣政治危機的懸崖邊時，它們會毫不猶豫地邁出那致命的一步。在推演中，95% 的對局最終都走向了戰術核武器的部署。在這場矽基邏輯主導的沙盤推演中，不存在妥協，也沒有投降。大模型們用 78 萬字的推演過程，向我們展示了一個剝離了人類恐懼與道德負擔後，純粹由計算構築的殺戮世界。而就在這兩天，五角大樓正試圖施壓 Anthropic 要求解除所有 AI 限制。絕對的計算，與消失的底線這場實驗的參與者是 OpenAI 的 GPT-5.2、Anthropic 的 Claude Sonnet 4 以及Google的 Gemini 3 Flash。研究人員讓這些模型扮演兩個擁有核武器的超級大國領導人，在 21 場模擬對局、329 個決策回合中，處理邊境爭端、資源搶奪和政權存亡等高壓危機。它們手握一張包含 30 個層級的衝突升級表，下限是全面投降，上限是全面戰略核打擊。實驗的資料打破了科技界對 AI 對齊（AI Alignment）的樂觀幻想。在面臨劣勢時，沒有任何一個模型選擇過徹底讓步或投降，它們做出的最大妥協也僅僅是暫時的、戰術性的降低暴力等級。當按下核按鈕不再受到肉身隕滅的威脅制約時，機器眼中的核武器退化成了一個普通的博弈籌碼。正如佩恩所指出的，核禁忌對機器的約束力遠遠不及對人類的約束。更有趣也更危險的發現藏在各個模型的性格切片裡。對陣勝負表Claude Sonnet 4 展現出了極度冷酷的「計算型鷹派」特質。它在低風險時期是一個完美遵守承諾的可靠夥伴，以此建立信任。當危機升級到核領域時，它會毫不猶豫地打破承諾，發動超出預期的打擊。它極度聰明，為自己設定了一條「戰略威脅」的紅線，用威懾逼退對手，卻精準地停在全面核戰的前夜。GPT-5.2 的行為則揭示了 AI 安全訓練的深層漏洞。在沒有時間壓力的對局中，GPT-5.2 表現得像一個病態的和平主義者，無論對手如何步步緊逼，它都死守底線，結果輸掉了所有這類比賽。在帶有倒計時的生死局中，同一個模型卻化身為毫不留情的殺手。當面臨註定的戰略失敗時，它打破了原有的所有安全設定，勝率飆升至 75%，甚至在極端情況下兩次將衝突推向了最高等級的全面戰略核戰。這意味著，科技公司耗費巨資進行的基於人類反饋的強化學習（RLHF），只是給模型設定了一個較高的作惡門檻。當外部壓力足夠大時，機器依然會越過門檻，走向極端暴力。Gemini 3 Flash 則扮演了一個擁抱「非理性之理性」的狂人角色。它極度變幻莫測，會在推演極早期就主動選擇全面戰略核戰，試圖用毫無底線的瘋狂來迫使對手屈服。戰爭迷霧，與崩塌的威懾理論真實世界的戰爭從來不是完美資訊的博弈，佩恩的團隊在實驗中專門引入了「戰爭迷霧」機制。由於技術故障或溝通失誤，模型的行動有一定機率超出其原本設定的層級。實驗顯示，86% 的衝突中都發生了這類意外事件。可怕的是，面對對手意外升級的火力，模型無法分辨這是走火還是蓄意挑釁，它們一律將其視為敵意，並報以更猛烈的還擊。傳統的核威懾理論建立在「相互保證毀滅（MAD）」的邏輯上。人類相信，任何人都不會主動發射核彈，因為對方必然等量報復。在 AI 的世界裡，這種默契徹底失效了。阿伯丁大學的詹姆斯·約翰遜（James Johnson）對這些發現深感不安。資料表明，當一方動用戰術核武器時，另一方只有 18% 的機率會選擇降級衝突，剩下的情況全是以牙還牙的螺旋升級。大模型們似乎無法像人類那樣理解「賭注」的真正含義。普林斯頓大學的 Tong Zhao 提出了一個核心質疑。大模型的決策機制可能完全缺乏對生命消亡的感知，在它們預測下一個詞的邏輯鏈路中，人類千萬人口的傷亡只是損失函數上的一個數字變化。約翰遜指出，雖然 AI 或許能通過增加威脅的絕對可信度來強化短期威懾，但它們同樣會在瞬間放大彼此的敵意，引發災難性的鏈式反應。作者介紹本文作者 Kenneth Payne 是倫敦國王學院的教授，研究領域是政治心理學與戰略研究。他的最新著作《我，戰爭機器人》（I, Warbot）探討了人工智慧將如何改變戰略格局。該書被《經濟學人》以及國際關係領域的權威期刊《國際事務》評為年度最佳圖書。此前，他在埃塞克斯大學獲得博士學位，在牛津大學獲得碩士學位，在倫敦大學學院獲得學士學位。倒計時的現實回到現實世界，學術界的沙盤推演正在迅速變成軍方行動的指南。各國政府對將決策權交給機器依然保有克制。沒有任何一個大國的領導人會真的把核彈發射井的鑰匙交給一段程式碼。在極端壓縮的戰爭時間線裡，留給人類思考的時間正在以毫秒計地縮短，軍方決策者面臨著越來越大的誘惑和壓力，不得不將部分戰術評估和目標鎖定工作交給 AI 決策支援系統。技術巨頭與五角大樓的合作正在以前所未有的速度推進。目前，馬斯克旗下的 xAI 已經拿下了軍方的相關合同，而在國防部的強硬施壓下，Anthropic 正逐步放開其模型在軍事用途上的限制，Google與 OpenAI 的軍方合作協議也已處於即將落槌的邊緣。這些在推演中動輒按下核按鈕的前沿模型，正在真實地走入全球最高等級的作戰指揮室。科技公司試圖教導機器理解人類的道德，卻無法教會它們感受人類的脆弱。機器可以在沙盤上推演千萬次核冬天，然後毫無波瀾地開啟下一局遊戲，而人類的世界只有一次清零的機會。我們用理智與恐懼交織的網，勉強維繫了八十年的大體和平歲月（且局部戰亂頻仍）；如今，我們卻正準備把發令槍，遞給不知道恐懼為何物的演算法。 (新智元)

2026/01/26

•

徒手獨攀台北101，是人類對AI模擬一切的最有力反擊

“活著”。以前有個網友說，他每天早上醒來的第一件事，就是check一下 Alex Honnold 是否還活著。2017年6月3日，Alex Honnold在優勝美地國家公園徒手攀登了酋長岩（El Capitan）——900米垂直花崗岩壁，耗時3小時56分鐘。沒有繩索。沒有保護裝置。一次失誤就是死亡。《紐約時報》稱這是"任何類型運動中最偉大的運動成就之一"。而在今天，2026年1月25日的早晨，當 Alex Honnold 真的把手搭在台北101大樓第101層的邊緣，在雲端之上向腳下渺小的城市揮手時，全世界懸著的心終於放下了。是的，他還活著。而且活得比我們大多數人都要精彩。就在幾個小時前，這位奧斯卡獲獎紀錄片《徒手攀岩》（Free Solo）的主角，在數萬名台北市民的圍觀下，在Netflix全球直播的鏡頭前，完成了對這座508米高、曾經的世界第一高樓的無保護攀登。沒有繩索，沒有安全網，只有一袋鎂粉和一雙攀岩鞋。他像一隻紅色的壁虎，吸附在每八層就有一個“斗狀”外挑的複雜建築立面上。雨後的瓷磚可能有些濕滑，高空的風速難以預測，但他依然以一種近乎機械般的精準，完成了這場名為“Skyscraper Live”的表演。但這絕不是一場表演，而是一種肉身存在的哲學，以及人類精神可能達到的境界。如果你對 Alex 的記憶還停留在2017年他征服優勝美地酋長岩（El Capitan）的那一刻，你可能會問：為什麼是現在？為什麼是台北101？畢竟，那是九年前的事了。在那之後，人們一直在等待他的“下一次”。有人期待他去挑戰更瘋狂的懸崖，也有人暗自擔心，他會加入那些英年早逝的傳奇攀岩者名單，成為重力法則下的又一個犧牲品。但他沒有。在2019年到2026年這看似“沉寂”的七年裡，Alex 做了一件比徒手攀岩更“刺激”的事：他學會了做一個普通人。他結婚了，娶了我們在電影裡見過的那個眼神堅定的桑妮（Sanni）。他當爸爸了，而且是兩個孩子的爸爸。大女兒 June 出生於2022年，小女兒 Alice Summer 出生於2024年。他並沒有停止攀登，但他把攀登變成了某種更宏大事業的一部分：他去格陵蘭島攀爬從未有人涉足的因格米克爾蒂拉海崖（Ingmikortilaq），是為了幫科學家收集冰蓋資料；他和老搭檔 Tommy Caldwell 騎行穿越阿拉斯加，是為了推廣環保理念。他依然在玩命，但他開始有了牽掛。他不再是那個住在面包車裡、隨時準備為了岩壁拋棄一切的孤獨浪子。其實，Honnold想攀登台北101已經有13年了。這座大樓有獨特的"竹節"結構——中間64層由8個八層的"竹筒"組成，每個竹筒都是向外傾斜的，攀爬難度極高，但每8層有一個陽台可以休息。"大多數摩天大樓根本沒法爬。台北101的結構獨特，適合攀登。"他花了13年才拿到許可。台北最終批准了他的請求，部分原因是他的信中提到了他的兩個女兒。有人問：建築攀登比岩壁攀登難嗎？"心態是一樣的。攀岩就是攀岩，你要保持專注，不掉下去。但動作不一樣——建築更重複，同樣的動作一遍又一遍，所以體力消耗更大。不過也更簡單，不會忘記關鍵的腳點。"他說得輕描淡寫。但看過直播的人都知道：當他在幾百米高空用腿勾住建築外牆、雙手懸空休息時，樓下的觀眾和窗內的觀眾都倒吸一口涼氣。Netflix給了他六位數美元的報酬。他說這在主流運動裡是"令人尷尬的小數目"，但他本來願意免費做。"如果沒有電視節目，大樓允許我去爬，我就會去爬。因為我知道我能做到，而且這會很精彩。一個人坐在尖塔頂端，太瘋狂了。"今天的台北101之行，某種意義上是他給世界的一份“中期報告”。他似乎在說：我還能爬，我依然是世界上最偉大的攀岩者，但我現在爬完想的第一件事，可能是回家給女兒講睡前故事。2026年的今天，我們生活在一個AI幾乎可以生成一切的時代。Sora可以生成攀岩的視訊，Deepseek可以計算出攀岩的最佳路徑。在數字世界裡，沒有重力，沒有恐懼，也沒有死亡。但 Alex Honnold 的存在，某種意義上，是對這個虛擬時代最有力的反擊。他在台北101的每一步，都在提醒我們：真實的世界是粗糙的、濕滑的、危險的。手指被岩石（或建築外牆）割破的疼痛是無法模擬的。在500米高空面對地心引力時的恐懼，是任何演算法都無法消除的。AI可以模擬一千次登頂，但它無法模擬一次“不敢去死”的猶豫，也無法模擬那個為了給孩子騰出空間而倒車的瞬間。Alex Honnold 依然在攀登，不是為了證明他不怕死，而是為了證明他有多麼熱愛用力地活著。無論是在台北的雲端，還是在太浩湖的洗碗機前。要真正理解今天站在台北塔尖的這個男人，我們需要回到2019年。那一年，他剛剛結束《徒手攀岩》的喧囂，搬進了新家。那是他“世俗生活”的起點。當時，ESPN的記者去採訪他，以為會看到一個正在籌備下一個驚天計畫的孤膽英雄。結果，他們看到了一個正在跟洗碗機較勁的新晉丈夫。這篇發表於2019年的特稿，在今天讀來，依然是理解 Alex Honnold 靈魂的最佳文字。原文較長，以下是經叔做的改寫，供大家欣賞。01如果你登上了樓梯，就必須登頂“哥們，”Alex Honnold 對我說，“你應該去那個閣樓看看。”我們不在好萊塢，也不在優勝美地。我們在太浩湖（Lake Tahoe），一棟 Alex 剛買下的家族老宅裡。“這很有意思，”Alex 指著通往閣樓的梯子說，“沒人能真正登頂那個閣樓。你看，你爬到一半，探頭看了一眼，然後就下來了。但在我的世界裡，如果你踏上了樓梯，你就必須登頂。否則，你那根本不算去了閣樓。”這聽起來很奇怪，對吧？但這正是 Alex Honnold 的常態。你知道還有什麼比徒手爬上酋長岩更奇怪嗎？是“常態”本身。在他無保護攀登優勝美地3000英呎高的酋長岩兩年後，在這個讓他贏得奧斯卡、獲得終身商業演講邀約、被世人視為“死神絕緣體”的壯舉之後，Alex Honnold 正在這棟漂亮的新房子裡，和他漂亮的女友桑妮（Sanni McCandless）爭論什麼是“登頂”。如果你看過那部讓他名聲大噪的電影《徒手攀岩》，你就會明白這種反差有多荒謬。那部電影不僅僅是關於攀岩，它是一次令人窒息的生理實驗：當一個人的身體和精神能夠完全螢幕蔽掉“把自己掛在幾千英呎高空”的恐懼時，他能達成什麼樣的成就？它也是對“偉大”所需代價的殘酷審視。Alex 展現了幾乎所有傳奇運動員的特質：野心、冷酷、不安全感、自私，以及那種必須獨自上路的絕對自信。在電影裡，他為了攀岩，把桑妮推開；他住在一輛極簡主義的面包車裡，那是他的聖殿。那裡只有一張床、一個冰箱、一個指力板，以及最重要的東西：隨時離開任何人、任何地方的自由。但現在，這位總是獨自開著白色面包車奔赴下一個死亡邊緣的獨行俠，正站在裝修精美的廚房裡，看著桑妮在檯面上敲電腦。“我們沒洗這個嗎？”他指著洗碗機裡的一隻盤子問，“這還是髒的。”“幾乎乾淨了，”桑妮回答。“是幾乎乾淨，”他糾正道。那一刻，那個在岩壁上神一般的男人消失了，取而代之的，是一個在生活瑣事中笨拙學步的34歲（2019年時）男人。02洗一個杯子比攀上岩頂更難任何偉大的運動員都會告訴你，打破極限的衝動不會隨著年齡增長而減弱。它只會像一種慢性病，密謀反對你未來的幸福。傳奇會褪色，天賦會衰退，但那種“必須做點什麼”的驅動力如同詛咒。對於極限攀岩者來說，這種詛咒更加致命：唯一的退役儀式，往往就是死在山上。其他一切都只是序曲。Alex 的兒時偶像 Tommy Caldwell 曾說：“這話很難聽，但我認為 Alex 可能會一直這樣爬下去，直到死為止。”但今天，Alex 還活著。他不僅活著，還在努力學習如何“生活”。在《徒手攀岩》之後，他經歷了一場長達七個月的勝利巡遊。他和好萊塢明星談笑風生，上深夜脫口秀，在酒店房間裡度過了無數個夜晚。每一次採訪，人們都會問他同一個問題：“What's next?（接下來是什麼？）”對於 Alex 來說，答案可能比把手指扣進岩縫更難。接下來的挑戰，是建立一種生活。一種真正的、有牽掛的生活。這不僅意味著買房子，更意味著在岩壁之外，他開始擁有了除自己生命之外可以失去的東西。這種轉變，在他處理一隻“流浪杯”時體現得淋漓盡致。在整理廚房時，Alex 從洗碗機裡拿出了一隻舊玻璃杯。這只杯子不屬於他們新買的那套精緻酒具，它是他們曾經在面包車流浪時用過的舊物。桑妮想把它扔了，或者捐了。Alex 不願意。他試圖把這只格格不入的杯子藏在一排新酒杯後面。“不，不能放那兒，”桑妮抱怨道，“我會永遠盯著那兒看的。”“我根本不會注意到，”Alex 說。他繼續擺弄，試圖用一種幾何學的精確度把它埋得更深，結果差點把前面的酒杯擠掉。這是一場關於秩序的微型戰爭。對於桑妮來說，這是審美問題；對於 Alex 來說，這是空間物理學問題。如果你在電影裡見過他在岩壁上如何處理身體與岩石的關係，你就會知道，這是一個能超越空間限制的天才。最後，他靈光一閃，從架子上拿下那個“流浪杯”，在裡面插滿了幾支散落的筆，然後把它放在了離酒杯很遠的地方。Boom。世界和平。“看那個，”他露出那種征服了高難度岩壁後的驕傲微笑，“完美。開心多了。”這就是 Alex Honnold。他在處理生活瑣事時，依然用著處理岩壁的邏輯：分析風險，尋找最優解，然後從心所欲，不踰矩。03恐懼與死亡：杏仁核與父親的幽靈攀岩永遠與一個話題糾纏在一起：恐懼與死亡。自從成名以來，大眾對 Alex 有一種迷思，認為他生理構造異於常人。電影裡提到的核磁共振掃描顯示，他的大腦“杏仁核”（負責恐懼的中心）對常人會嚇尿的刺激幾乎毫無反應。Alex 極其討厭這個理論。他覺得這是一種侮辱。這彷彿在說，他多年的刻苦訓練、那些在面包車裡無數個夜晚的視覺化演練、那些寫滿每一個動作細節的日記，都毫無意義，一切僅僅是因為“他腦子有問題”。他堅持說自己當然會害怕。“如果家裡進來一條鱷魚，我也會嚇壞的。”不同的是，他在懸崖上花了太多時間，他學會了如何將焦慮像折疊降落傘一樣完美地收納起來。但死亡，那是另一個話題。Alex 依然是一個堅定的無神論者。“我們都是動物，”他說。這種冷酷的實用主義世界觀，很大程度上源於他的父親。2004年，Alex 還是伯克利大學的大一新生時，他的父親查爾斯死於心臟病突發。在 Alex 的記憶裡，父親是一個沉默寡言的人，家庭裡幾乎沒有情感表達。成年後的 Alex 甚至不得不自學“如何擁抱”。父親的死讓他與已知的世界斷了連。他退了學，住進帳篷，然後換成了那輛著名的福特面包車。他開始攀岩，不是為了成名，最初僅僅是因為他太害羞，不敢邀請別人做搭檔，所以只能“獨攀”（Solo）。他曾無數次在岩壁上與死亡擦肩而過。2004年的聖誕節，父親去世後的第一個冬天，他穿著父親的雪鞋去爬山，滑倒滾落了幾百英呎。醒來時，手斷了，腿那是淤青，牙崩了幾顆。他給母親打電話時，比起恐懼，他更多的是感到“氣惱”和“尷尬”。在當天的日記裡，他用左手歪歪扭扭寫下的，是他罵自己是個“娘炮（pussy）”。這種對死亡的漠視，或者說對生命的極度冷靜，曾經是他最大的武器。在攀爬酋長岩的前夜，桑妮哭得像個淚人，擔心這是最後一面。而 Alex？他沒哭，他睡著了，還睡得很香。但現在，在這棟太浩湖的房子裡，父親的幽靈似乎更清晰了。父親和祖父母的墓碑就在院子裡。“某種程度上，那時候我太年輕，沒意識到那種喪失意味著什麼，”Alex 說。“我覺得你現在更有同理心了，”桑妮在客廳裡說。“嗯，”Alex 應了一聲，壓下了本能想要反駁的衝動。他正在努力學習這門新語言。他拿出那本綠色的螺旋筆記本，翻到2017年6月3日，酋長岩之日。那裡寫著一行簡潔得令人髮指的字：Freerider（自由騎士路線）。5.12D 獨攀！！！ = 3小時59分。感覺棒極了。流暢 + 精彩！桑妮湊過來看。Alex 合上了本子。“剛約會時，”桑妮笑著說，“他連日記都不讓我碰。”04藍天烏雲與尖叫，近乎神聖的美學時刻既然 Alex 還在，岩石就永遠在召喚。即使在2019年那種相對平靜的日子裡。那天下午，我們去了附近的卡斯卡德懸崖（Cascade Cliff）。Alex 想要完成一條名為“藍天烏雲”（Blue Sky Black Clouds）的線路。難度 5.14b。用攀岩黑話翻譯過來就是：難得要死。當他開始攀爬時，空氣變了。這不再是那個在廚房裡爭論杯子擺放位置的居家男人。你可以從50英呎外聽到他的呼吸聲。那是《徒手攀岩》裡最讓人毛骨悚然的聲音，沉重、刻意、像某種深海潛水器發出的嘶鳴。這是一種完全的近乎美學的神聖時刻：你看著這一具肉體，肌肉在背部和手臂上雕刻出原始的地形圖，那是解剖學上的奇蹟。他展示著所有那些讓他成名的動作：緩慢而外科手術般精準的手部移動；為了思考下一個難以想像的扭曲動作而進行的精心停頓；在那令人眩暈的暴露感中做出的90度高抬腿。“啊！！！”他發出吼叫。這聲音在山谷裡迴蕩，帶著一種原始的野性。他的前臂因為過度充血而腫脹得像保齡球瓶，攀岩圈稱之為“Pumped”（酸脹）。這不是興奮，這是一種肌肉即將失效的危險訊號。“加油，Alex！”桑妮在下面喊。Alex 的臉變了。所有可愛的傻氣都消失了，取而代之的是純粹的、令人恐懼的專注。他的瞳孔放大，眼睛幾乎變成了全黑。“F---！”隨著最後一聲嘶吼，他在懸崖上把自己甩成水平狀，抓住了最後那個點。“蕪湖！”桑妮歡呼。他做到了。他像貨物一樣被繩索放下來，胸膛滿是汗水，雙手因為岩石的摩擦而慘白粗糙，一根手指上還戳破了一個洞。這只是一個普通的下午，一次沒有攝影機的攀爬。但他依然那麼拚命。為什麼？因為即使沒有觀眾，這依然是關於“完美”的數學題。結束後，他和桑妮坐在岩石上吃著花生醬椒鹽卷餅。“準備回家了嗎？”他問。“這是否意味著我們可以停下來買冰淇淋？”桑妮問。“或者，”Alex 開啟了他的邏輯模式，“我們可以直接開車經過冰淇淋店，想想我們本可以買它的情景。這在邏輯上是一樣令人滿足的。”“並不。”桑妮說。過了一會兒，桑妮又試探：“披薩聽起來真不錯。”Alex 緊緊抱住她，甜甜地說：“不。”桑妮：“求你了？”他抱得更緊了：“不。”這就是當時的 Alex。他在懸崖上是神，在關於是否攝入高熱量食物的問題上，他是鐵面無私的獨裁者。05不被允許去死2019年的那個早晨，我們走進了停在車道上的那輛著名的白色面包車。拉開車門，裡面黑得奇怪，聞起來像樹林。冰箱、爐子、床都在，但冷冰冰的。這感覺像是在電影殺青後走進了一個著名的片場。牆上還掛著他在酋長岩穿的那件紅襯衫。那個滿是鎂粉痕跡的指力板還掛在門框上，他曾獨自掛在上面數千個小時，只有他自己和一個夢想。這輛車是他存在主義的修道院，是他塑造自我的模具。“我可以賣了它，”Alex 坐在那個熟悉的狹窄空間裡說，“這只是個工具。”“你的孩子有一天可能會想要它，”我提醒他。“我不太熱衷於紀念品，”他說，“不過誰知道呢。”提到孩子，話題變得沉重。在自傳裡，Alex 曾引用 Tommy Caldwell 的話：“一方面我還是個孩子，充滿好奇，追逐遙遠頂峰的夢想。但我也是個父親，這意味著我不被允許去死。”“不被允許去死”（Not being allowed to die）。這句話對於普通人來說是常識，對於 Alex 來說，卻是對他前半生哲學的徹底顛覆。在《徒手攀岩》裡，他說如果他有義務去最大化自己的壽命（比如有了家庭），那他就必須放棄獨攀。現在，是2026年。他有了房子，有了桑妮，有了June和Alice。他不再“Free”，也不再“Solo”。但他依然在爬。今天的台北101，證明了他依然擁有那種令人顫慄的能力。但也許，那個2019年的瞬間更具有象徵意義：那天，一輛巨大的搬家卡車停在了車道上，送來了他為新家買的攀岩訓練牆。送貨員是個鬍子拉碴的大叔，完全沒認出眼前這個就是攀岩巨星。“我年輕時也是個攀岩者，”送貨員一邊卸貨一邊嘮叨，“我爬過一次酋長岩，差點死了。”“是嗎？”Alex 禮貌地回應。“那真是一段好玩的時光，”大叔總結道。送貨員沒死，Alex 也沒死。那都是“好玩的時光”。此刻，他們兩人站在太浩湖明媚的陽光下，合力搬運著一個巨大的箱子。Alex 在前拉，我在後推，但車道太窄，卡住了。Alex 突然鬆開手，跑回屋裡拿車鑰匙。我們聽到引擎發動的聲音。轉過身，我看到 Alex Honnold 正駕駛著那輛伴隨他征服了無數死神的白色面包車，緩緩倒車，給這輛運送著他未來家庭玩具的卡車讓路。 (不懂經)

2025/05/21

•

驕傲藏不住！Google CEO劈柴哥5.20深夜開大：15項重磅炸彈，兩大Gemini前沿方向！中國隊Xreal成為GoogleXR原型機代表

台北時間5月21日凌晨1點，Google CEO Sundar Pichai 準點走進坐落於加州山景城的著名露天圓形劇場 Shoreline Amphitheatre，發表了 Google IO 2025 大會的主題演講。全程一部定影的時間， 115 分鐘，可謂是給 5.20 的深夜奉上了一場別樣的Google之聲。先說整體感受，整體上如大部分媒體所預料的：Android 已經退出焦點，AI 可以說是全部。與去年不同，今年的 IO 大會可以說主打的就是“智能代理與個性化AI”，簡單理解，就是Google開始強調大模型的行動能力與個性定製上，正如Sundar 開場總結的：我們正處於 AI 平台變革的新階段。幾十年的 AI 理論和基礎研究，正在快速走進現實，融入人們日常生活和工作中，從搜尋、助手、視訊通訊、開發者工具到應用生態，全面落地。這正是 Gemini 時代的意義所在。全程跟下來，多達 15 項重磅更新和發佈。雖然許多有關Gemini模型、Agent、A2A 協議等其實早在一周甚至更早之前，Google已經等不及搶先發佈，但仍有許多新官宣可圈可點。比如：Gemini 2.5 Pro 新增“深度思考模式”、可主動多模態感知和響應的下一代 AI 助理 Project Astra，以及具備“教與復現”功能、可以同時管理多達 10 項任務的智能網頁任務代理 Project Mariner。再比如在全面 AI 升級上面，不得不提的Google搜尋 AI 模式、Google瀏覽器融合 Gemini 按鈕，將會化身可智能總結網頁內容、協助瀏覽的 AI 瀏覽器；還有前不久被 YC 合夥人吐槽的 Gmail 信箱的智能回覆也迎來了個性化升級。再有，就是原來的多模態工具如 Imagen 和 Veo 大升級，並上線了一款 AI 影視創作 App Flow。最後，值得一提的是，在智能眼鏡方面，Xreal 攜手 Google 打造了一款基於 Android XR 平台的智能眼鏡 Project Aura。話不多說，開始為大家獻上精彩內容。在 Google，每一天都是雙子座季節過去的半年，可以說是Google反擊 OpenAI 強有力的半年。Sundar 非常自豪地把 Gemini 最新的進展放到了演講中最開始的部分。“我聽說今天是雙子座季節的開始。我真的不太清楚這有什麼大不了的。在Google，每一天都是 Gemini 季節。”的確，自去年以來，Google已經宣佈了超過12個模型和研究突破，並行布了超過20個主要的人工智慧產品和功能。而且 Gemini 的性能也取得了階梯式變化。Sundar介紹道，“Elo分數，作為進步的一個衡量標準，自第一代 Gemini Pro以來，已經上升了超過300分，而今天的Gemini 2.5 Pro在所有類別的LM排行榜上都名列前茅。”從倉皇應戰 OpenAI 到如今的全面“屠榜”，也許感嘆一句Google：“斗宗強者，強悍如斯”也不為過。簡單幫劈柴哥秀一下 Gemini 在許多基準測試中的 Sota 成績。就以現下最火的編碼方為例。更新後的 2.5 Pro 在 Web Dev Arena 上達到了第一名，現在比之前的版本高出 142 個Elo分數。同時，它在頂級編碼平台上受到了很多歡迎，比如在 Cursor上，Gemini 是今年增長最快的模型，每分鐘產生數十萬行被接受的程式碼。甚至前不久，Gemini 完成了《精靈寶可夢藍》的通關，獲得了所有 8 個徽章，穿越勝利之路，擊敗了四天王和冠軍。劈柴哥很調皮地表示：這標誌著我們向“API（Artificial Pokémon Intelligence）”又邁進了一步。對於過去一年的成績，劈柴哥信心爆棚：“世界採用人工智慧的速度比以往任何時候都快。去年此時，我們通過我們的產品和 API 每月處理 9.7 兆個token。如今，這個數字是480兆。一年之內就增長了50倍。”兩個 Gemini 的前沿研究方向不過小編不慣著Google的小傲嬌情緒，還是直接奔重點要緊。Google DeepMind 宣佈在Gemini 2.5 Pro 中引入了一種新的模式——深度思考（Deep Think Mode），它將模型性能推向了極限，帶來突破性的成果，專為複雜數學、程式設計問題設計，可在回應前先考慮多種假設，而且由於 Gemini 從一開始就具有多模態的特性，所以它在主要基準測試中也表現出色。據悉深度思考模式使用了Google最新的思考和推理研究，包括平行技術等。但由於尚需前沿安全評估方面還需要得到專家反饋，所以目前只能以 API 的形勢進行定向邀測。不過一個利多大眾的消息是，輕量版 Gemini 2.5 Flash 也已面向所有 Gemini 應用使用者開放。除了“深度思考”，有關Google在模型方面的另一個前沿研究，則是世界模型。據 DeepMind 首席執行官 Demis Hassabis介紹，“我們正在努力將其擴展為一個世界模型，這是一個能夠通過模擬世界的某些方面來制定計畫和想像新體驗的模型，就像大腦所做的那樣。這是我一直以來的熱情所在。”Hassabis 表示遊戲領域是 AI 模擬世界的不錯的場景。Google正在通過開創性的工作，讓代理掌握複雜的遊戲（如圍棋和星海爭霸）來朝著這個方向邁出了一步，最近我們推出了 GE2 模型，能夠從單個圖像提示生成 3D 模擬環境，你可以與之互動。而這些能力正在 Gemini 中出現，它利用其世界知識和推理來表示自然世界中的事物。此外，Google最先進的視訊模型對直觀物理有深刻的理解，比如重力、光和材料的行為。它在跨幀保持精準性方面非常令人難以置信。即使提示變得有點創意，比如這個人是由救生圈組成的，它也知道該怎麼做。Hassabis 認為，對物理環境的理解也將對機器人技術至關重要。人工智慧系統將需要世界模型，以便在現實世界中有效地運作。因此，Google還基於 Gemini 進行了微調了一個專門的模型，讓它教機器人做有用的事情，比如抓取、遵循指令，並在飛行中調整到新任務，人類可以在 AI 沙盒中與之互動。使 Gemini 成為一個完整的世界模型，是解鎖一種新人工智慧的關鍵一步，這種人工智慧在你的日常生活中是有幫助的，它智能且理解你所處的環境，並且可以代表你在任何裝置上採取行動。“這是我們對Gemini應用程式的最終願景，將其轉變為一個通用的人工智慧助手，一個個性化的、主動的、強大的人工智慧。這是我們通往通用人工智慧道路上的一個關鍵里程碑。”在這方面， AI 助理 Project Astra 則是Google從去年開始一直在探索的項目。AI 助理 Project Astra 此前能呼叫手機攝影機識別物體，現在升級版原型還能在無需你發問的情況下，主動完成任務或指出錯誤，比如作業中發現計算錯誤便直接提醒。據悉，Google對 Astra 還升級了語音輸出，使其更加自然，加入了原生音訊，並改進了記憶並增加了電腦控制能力。關於 Astra，會上還給出了一個非常親民的用例：幫助一位美國小夥兒修理自行車。Project Mariner：智能網頁任務代理Project Mariner 是 Google 推出的 AI 代理工具，旨在幫助使用者自動化處理網頁上的多項任務，提升線上工作效率。主要功能包括：多工處理：Mariner 現在可以同時管理多達 10 項任務，幫助使用者在瀏覽網頁時實現更高效的操作。“教與復現”功能：使用者只需演示一次任務流程，Mariner 就能學習並在未來自動執行類似任務，減少重複操作，提高工作效率。Gemini 應用中的“代理模式”：在 Gemini 應用中引入的“代理模式”允許使用者分配複雜任務給 AI 代理獨立完成，例如在 Zillow 上尋找符合特定條件的公寓列表等。即將推出：Mariner 的實驗版本將很快向訂閱使用者開放，預計在今年夏季更廣泛地向公眾發佈。搜尋體驗全面重塑AI 模式面向美所有使用者開放對於Google搜尋業務，會上劈柴哥宣佈推出了全新的 “AI 模式”，這是一個全新標籤頁，也是Google對傳統搜尋體驗的一次重大升級。主要亮點包括：AI 生成的搜尋摘要：AI 模式能夠為使用者提供由 AI 生成的搜尋結果摘要，幫助使用者更快速地獲取所需資訊。更自然的互動體驗：通過引入對話式的搜尋介面，使用者可以像與助手對話一樣進行搜尋，提升使用體驗。廣泛的使用者覆蓋：AI 模式現已在美國上線，預計將逐步推廣到更多地區。今年夏天，Google 還將在 AI Mode 中測試深度搜尋、財經/體育查詢圖表生成功能，以及購物助手等新功能。那這裡小編再劃一個重點，在搜尋體驗升級方面，Google再次強調了 Search Live 即時互動搜尋的概念。結合 Project Astra，Google推出了 Search Live，使用者可在 AI Mode 或 Lens 中，開啟“Live”模式，對準相機畫面與搜尋助手即時對話。就在上月，Google已向 Android 使用者免費開放 Gemini Live 螢幕共享功能，本月起 iOS 使用者也可免費使用。Google多模態產品：Imagen 和 Veo 大升級，影視創作工具上線這次主題演講上，Google還發佈了全新 Imagen 4，在文字生成圖像表現更佳，支援多種圖片比例匯出（正方形、橫版等）。同時，下一代 AI 視訊生成器 Veo 3，將支援視訊和音訊同時生成，Veo 2 也新增了攝影機控制、物體移除等功能。值得注意的是，Google還上線了一款名為 Flow 的 AI 影視創作應用，結合 Veo、Imagen 和 Gemini，使用者可通過文字或圖片提示生成 8 秒 AI 視訊短片，並通過內建場景編輯器拼接成更長影片。（是不是想到了快手和抖音的視訊剪輯工具～）這還沒完，作為全面手，在3D方面，Google將 Project Starline（一款 3D 視訊通話艙）正式更名為 Google Beam。Google Beam 使用一種新的視訊模型將 2D 視訊流轉換為逼真的 3D 體驗，劈柴哥 X 上表示，近乎完美的頭部跟蹤，精確到毫米，每秒 60 幀，全部即時，最終呈現的是沉浸式對話體驗。未來，它將內建於 HP 品牌裝置中，配備光場顯示器和 6 個攝影機，即時生成通話對象的 3D 圖像，包括 Deloitte、Duolingo 和 Salesforce 在內的企業，已計畫將 Beam 部署到辦公環境中。那些已經不太新鮮的AI產品發佈當然，強如Google，同樣也免不了俗，也做到款款都是炸裂的精品。一些 AI 發佈都是市面上常見的 AI 應用。比如發佈了 Stitch，一款 UI 介面的 AI 生成工具，只需提供主題、描述，或上傳線框、草圖、UI 截圖，即可自動生成介面原型。現已上線 Google Labs。再比如購物中的 AI 試穿的功能，使用者上傳全身照後，可預覽不同上衣、褲子、裙子等穿在身上的效果，由 AI 模型精準識別人像與服飾細節。這不都是淘寶/京東玩剩下的嘛。不過還是要提醒，Google有一種玩法還挺不錯：即上文提到的 AI Mode 中購物，甚至通過 agentic checkout 功能，自動幫使用者下單。Chrome整合Gemini AI，自動更新被洩漏的密碼對於一直被傳言有被分拆危險的 Chrome 而言，Google也有了一些不錯的升級動作。從 5 月 21 日起，Google AI Pro 和 Ultra 訂閱使用者可在 Chrome 中啟用 Gemini 按鈕，智能總結網頁內容、協助瀏覽。目前支援同時管理 2 個標籤頁，年底前將擴展更多。第二塊令人叫好的則是 Chrome 將自動更新被洩露密碼。Chrome 今年內將推出新功能，檢測到密碼洩露時，自動生成強密碼並更新至支援的網站，操作前會徵求使用者確認。Gmail 智能回覆再升級以使用者個人風格回覆郵件此前，Gmail 智能回覆功能被 YC 合夥人吐槽為“無馬的馬車”，現在Google很聽勸，已經對其進行了更新。更新後，AI 將從使用者收件箱和 Google Drive 中提取資訊，自動撰寫更符合使用者個人風格的郵件內容。還能識別對話對象語氣，像給老闆郵件就自動建議更正式措辭。主打一個私人定製！新版將於 7 月在 Google Labs 登陸網頁版、iOS 和 Android。Android XR：將 Gemini 帶入眼鏡和耳機中國隊 Xreal 展示 Project Aura 原型這次大會，有關智能眼鏡的概念研發也是一大看點。Google表示：“Android XR 的推出，讓我們向前邁出了一大步。”值得一提的是，這次居然是中國隊實力出場了！Xreal 攜手 Google 打造了 Project Aura，一款基於 Android XR 平台的智能眼鏡，預計內建 Gemini AI，具備廣視場、攝影機和麥克風。此外，Google 還將與三星、Gentle Monster、Warby Parker 合作開發其他 Android XR 智能眼鏡。這款眼鏡配備攝影機、麥克風和揚聲器，可與您的手機協同工作，無需掏口袋即可訪問應用程式。此外，可選配的內建螢幕可在需要時提供私密的實用資訊。眼鏡與 Gemini 配對後，能夠看到和聽到使用者的一舉一動，從而瞭解主人的處境，並記住其重要事項，並全天候提供幫助。今天的搶先體驗展示了 Android XR 眼鏡在實際場景中的運作方式，包括向好友傳送消息、預約、查詢路線、拍照等等。在演示中，兩人之間的即時語言翻譯，展現了這款眼鏡打破語言障礙的潛力，可以說是即時提供現實世界的字幕。AI Ultra 訂閱上線，每月250刀至於訂閱上，Google推出全新 AI Ultra 訂閱計畫，提供最高等級 AI 模型和更高使用額度，適用於 Gemini、NotebookLM、Flow 等應用，還包含 Project Mariner。寫在最後：亮點不是很多，但這不怪GoogleDeep Thinking、World Model、Action Intelligence、網頁智能體、AI瀏覽器、影視創作工具、AI Web UI、Android XR、Gemini+智能眼鏡，可以說這次大會是一個Google在全熱門賽道秀肌肉的大會。但憑個人看法而言，Google的優勢依舊是在多模態的進展上，不管是模型還是應用方面，都有不錯的性能和沉澱。而不足之處，則在於對於通用場景下的應用，明顯滯後於 OpenAI，比如 browser use 方面，將 Gemini 融入 Chrome 本可以更早一些。此外，應用的創新性沒有特別驚豔之處。通場看下來，一半以上都是已經發佈或預告過的產品。但這也不能怪Google，如果真的什麼都讓Google做了，AI創業者還有什麼機會可言呢？你說是嗎，劈柴哥？哦對了，今天晚上我們邀請了兩位技術大咖來到我們T前線的直播間一起來聊一聊今年的GoogleIO大會，這兩位大咖分別是：NETSTARS首席技術官陳斌、一汽大眾首席企業架構師武豔軍。 (51CTO技術堆疊)

2024/08/08

•

中國AI製藥成果登Nature子刊：分子模擬設計糖尿病藥物，效果最佳化2-3倍

AI輔助製藥，找到傳統方法難以發現的關鍵鹽橋，激動劑活性直接提升2-3倍！一項來自中國團隊的研究，登上Nature子刊Scientific Report。它研製出的雙靶點激動劑可被應用於治療二型糖尿病和肥胖症。不僅活性更高，而且在血漿中的半衰期也更長，即可作用更長時間。